import re
# findall 可以通过正则匹配到字符串中的内容，返回列表
# obj = re.findall(r"\d+","今年我都30岁了，还没赚够100w")
# print(obj)

# 如果没有匹配到结果，返回None
# search 一旦匹配到第一个结果就返回
# obj = re.search(r'\d+',"今年我都30岁了，还没赚够100w")
# print(obj.group()) #必须分组拿到数据

# 
# obj = re.match(r'\d+',"250今年我都30岁了，还没赚够100w")
# print(obj.group()) #必须分组拿到数据

# it = re.finditer(r'\d+',"250今年我都30岁了，还没赚够100w")
# for el in it:
#     print(el.group())

# obj = re.compile(r"\d+")
# print(obj.findall("250今年我都30岁了，还没赚够100w"))

# re中的分组-》取值的优先级
# 匹配（）中的
# print(re.findall(r"www\.(oldboy|baidu)\.com","www.baidu.com"))

# 在div标签中单独拿到3个哈
# print(re.findall(r"<div>(哈{3})</div>","<div>哈哈哈</div>"))
# print(re.findall(r"<div>哈{3}</div>","<div>哈哈哈</div>"))

# .*尽可能多的匹配，匹配到结尾，.*?尽可能少的匹配到第一个div结束
# print(re.findall(r"<div>电影名:(.*?)</div>","<div>电影名:阿拉斯加的日常生活</div>"))
# print(re.findall(r"<div>电影名:(.*?)下载链接:(.*?)</div>","<div>电影名:阿拉斯加的日常生活下载链接:http://www.baidu.com</div>"))
it = re.finditer(r"<div>电影名:(?P<name>.*?)下载链接:(?P<down>.*?)</div>","<div>电影名:阿拉斯加的日常生活下载链接:http://www.baidu.com</div>")
for el in it:
    print(el.group("name")+" "+el.group("down"))
    # print()